#Gemini AI
Google的Gemini開掛了,重磅利多多到數不過來
不到一周的時間,我數了數GoogleGemini的重磅利多,至少5個。不是AI應用的dau、tokens的線性利多,而是GoogleAI生態版圖的巨大擴張。Apple的AI選定了Gemini1月12日,Apple和Google發了個聯合聲明,Apple以後的"AI大腦"要用Gemini了。果粉之前的預期可是ChatGPT,結果呢?一年多過去,Apple官宣把核心AI基座換成了Google的Gemini。這個轉變的意義太大了。Apple全球有23.5億活躍裝置——iPhone、iPad、Mac等全家桶把OpenAI被踢出了核心圈。為什麼?Gemini是"原生多模態"架構,天生就能同時理解文字、圖片、聲音、視訊。Gemini 3 Pro/Flash更是靈活快捷適配各種差異化場景。Apple正在開發的那個"螢幕感知"功能——就是讓Siri能"看懂"你手機螢幕上顯示的內容然後幫你操作,用Gemini就順手得多。OpenAI的"泡沫論"和模型能力越來越難打動蘋果。Walmart和Shopify:Gemini的AI電商加速對Google來說,可能Walmart和Shopify的電商合作更有想像空間。1月11日,在紐約的零售業大會上,Walmart和Shopify幾乎同時宣佈跟Google深度合作。表面上看是"在Gemini裡能買東西了",但實際上Google在幹一件意義更大的事:制定代理商務(Agentic Commerce)的行業標準。什麼是代理商務?簡單說就是:以後你不用再打開淘寶、京東、亞馬遜這些App了,直接跟AI說"幫我買個XX",AI就替你下單、付款、安排配送。你只需要等著收貨。Google搞了個叫UCP的協議(Universal Commerce Protocol),讓所有商家都能用統一的格式接入AI。Walmart、Target、Best Buy、Home Depot這些零售巨頭都加入了,連Visa、Mastercard、American Express這些支付公司也進來了。這意味著什麼?意味著以後Gemini可能成為電商的大流量入口。你跟Gemini說"春季露營需要什麼裝備",它不光告訴你需要帳篷、睡袋、戶外爐具,還能直接推薦Walmart的具體商品,你點一下就下單了,全程不用離開聊天介面。Walmart甚至承諾30分鐘內送達。這不就是亞馬遜最怕的事情嗎?以前大家買東西第一反應是打開亞馬遜搜尋,以後可能變成直接問Gemini,亞馬遜就被架空了。Shopify那邊更有意思。它有560萬商家,大部分是中小賣家。這些人以前想觸達消費者,要麼花錢打廣告,要麼入駐亞馬遜被抽成。現在通過Gemini,他們的商品能直接出現在AI對話裡。使用者可能在聊滑雪的時候,就順手買了某個小眾品牌的滑雪鏡,根本不知道這品牌的獨立站長什麼樣。Shopify自己披露的資料也很誇張:過去一年,AI驅動的購買增長了11倍,這AI電商的爆發力太猛了。打通自家Gmail的30億使用者1月8日,Gmail正式全面上線Gemini功能,郵件摘要、一鍵生成回覆、AI收件箱檢視。看似不是什麼高科技,但架不住使用者基數太可觀了。而且,美國Fortune媒體還披露了一個重要的資料:70%的企業使用者採納了Gemini的寫作建議,轉化率遠超行業預期。商業化路徑也很清晰:基礎AI功能免費提供,但高級功能如信箱提問、專業校對需訂閱Pro版本$19.99/月,或者AI Ultra版本$249.99/月。30億使用者裡那怕只有1%付費,那也是3000萬訂閱使用者,光Gmail一項每年就能帶來幾十億美元的增量收入。Google披露他們總訂閱使用者已經超過1.5億了(含Google One和YouTube Premium),過去15個月增長了50%,而且還在加速。端側巨頭三星:加大合作至8億裝置除了前面那四個合作,還有一個差點被我忽略的,是另外一家全球端側巨頭三星的合作。今年CES上,韓國三星聯合CEO TM Roh宣佈要把Galaxy AI裝置數量從去年的4億台,翻倍到8億台,包括手機、平板、手錶、智能家電。Galaxy AI的品牌認知度在一年內從30%飆升到80%。通過三星的分發管道,Google Gemini獲得了一個無需app下載的大規模硬體分發優勢。你想想這個畫面:全球最大的Android手機廠商,加上全球最大的iOS裝置(Apple),加上全球最大的智能音箱和電視生態(Google自己的),全都跑Gemini。這樣的端側分發優勢,OpenAI和微軟短期內根本沒法趕上。最後聊聊估值Alphabet在2025年全年股價漲了65%,是"Big Five"裡表現最好的。市值首次突破了4兆美元,坐穩了全球第二大的公司。華爾街給的評級幾乎全部唱多,目標價普遍在315-390美元之間。Cantor Fitzgerald:將Google評級上調至“超配”,目標價370美元,稱其為“所有AI交易的王者”(King of all AI trades)。理由是Google是唯一一家同時擁有晶片、模型、雲基礎設施和數十億使用者級應用(App)的全端巨頭。Wedbush:認為蘋果的交易是“巨大的勝利”(Monster Win),消除了籠罩在Google頭上的長期陰雲。Morgan Stanley:隨著AI應用變得越來越複雜,企業將傾向於使用Google這樣的一體化平台,從而推高Google Cloud的估值。投行們的邏輯很直接:Gemini月活6.5億,增速30%,比ChatGPT的6%快多了;雲業務同比增長34%,合同積壓1550億美元;再加上這一波戰略合作的協同效應還沒完全釋放。AI一天,人間一年。一年前,大家還在討論ChatGPT會不會顛覆Google搜尋。現在劇情反轉了。Google不但守住了搜尋,還通過Gemini殺進了Apple、三星的生態、Walmart的貨架、Shopify的中小企業店舖、Gmail的信箱。而且這還只是Gemini的生態起點。2026年會是"AI落地驗證年"。到底誰的技術更強、誰的生態更穩、誰的商業化更順,很快就能見分曉了。 (FinHub)
蘋果選中Gemini,Google登上“4兆”
蘋果與Google達成為期數年的合作關係,將依託Gemini模型和Google的雲技術支援蘋果基礎模型,蘋果的聲明稱,經仔細評估,認為“Google的技術為蘋果基礎模型提供了最強大的基礎” 。早盤曾跌1%的Google母公司盤中轉漲並一度漲1.7%,盤初曾跌1%的蘋果也轉漲。蘋果公司確認,選定Google的Gemini 模型支援今年將面世的人工智慧(AI)新功能,包括新版的Siri功能。這一重磅消息推動Google母公司Alphabet周一股價止跌轉漲,市值史上首次突破4兆美元,成為繼輝達、微軟、蘋果之後第四家躋身這一超高市值的上市公司。美東時間12日周一,媒體援引蘋果的聲明稱,蘋果與Google達成為期數年的合作夥伴關係,蘋果將依託Google的Gemini模型和雲技術為未來的蘋果基礎模型(Apple Foundation Models)提供支援。消息公佈後,周一早盤曾跌1%的Alphabet股價迅速抹平跌幅,日內漲幅一度達到1.7%、漲至334.04美元,最終收漲超1%,連續三個交易日創收盤歷史新高,成功跨過4兆美元市值門檻。上周,Alphabet的市值剛超越蘋果,成為目前僅次於輝達的全球第二高市值公司。本周一盤初同樣一度跌1%的蘋果股價也小幅轉漲,收漲逾0.3%,在七連跌後兩連陽。這一合作標誌著蘋果在AI領域的重大戰略調整。雖然蘋果和Google在智慧型手機、作業系統和服務領域互為競爭對手,但兩家公司早已在搜尋業務上建立了合作關係。Google每年向蘋果支付數十億美元,以使其搜尋引擎成為蘋果產品的默認選項。Alphabet乘AI浪潮躋身4兆俱樂部Alphabet股價在2025年累計漲幅超過65%,成為美股科技七巨頭中表現最佳的股票,創下自2009年金融危機後股價翻倍以來的最大年度漲幅。這一強勁表現反映了投資者將該公司視為人工智慧領域的主要贏家。目前,只有輝達、蘋果和微軟的市值曾突破4兆美元大關。輝達和微軟於去年7月首次觸及這一里程碑,蘋果則在去年10月首次跨越這一門檻。不過,蘋果和微軟此後均已大幅跌破4兆美元關口。Alphabet的崛起得益於該公司在AI領域的全面佈局。去年11月,該公司推出了第七代張量處理單元Ironwood,這款定製AI晶片成為輝達產品的潛在替代選擇。去年12月,Google發佈的Gemini 3大語言模型獲得廣泛好評,在與OpenAI的GPT-5競爭中取得進展。上周,Google的市值自2019年以來首次超越蘋果。蘋果與Google合作詳情據本周一報導,與Google達成的多年合作協議將讓蘋果得以利用Gemini模型和Google雲技術支援未來版本的Apple Foundation Models。蘋果在聲明中寫道,經過仔細評估,蘋果認為“Google的技術為蘋果基礎模型提供了最強大的基礎,我們非常期待它將為使用者帶來的創新體驗。”不過,上述報導稱,新功能將於“今年晚些時候”推出,但蘋果的聲明並未提供具體時間表。蘋果和Google均未確認該協議的技術或財務條款。這一合作讓蘋果在AI領域的長期合作探索消息塵埃落定。去年8月曾有報導稱,蘋果正與Google就使用定製Gemini模型驅動新版Siri進行早期磋商。為了決定是繼續使用內部模型還是轉向合作夥伴,蘋果據稱同時開發了兩個版本的新Siri:代號為Linwood的版本由蘋果自有模型驅動,代號為Glenwood的版本則基於外部技術運行。據當時報導,為修復Siri的缺陷並讓已延遲推出的Siri AI功能順利面世,蘋果曾將Anthropic視為最佳合作對象,但Anthropic提出的財務條款要求促使蘋果擴大合作選擇範圍,除了Google和Anthropic,蘋果也在考慮與OpenAI合作。Google搶先在Gemini中引入廣告就在與蘋果達成合作的同時,Google上周日宣佈正在其AI購物工具中引入新的個性化廣告功能,標誌著科技巨頭在AI變現競賽中邁出關鍵一步。廣告主將能夠向通過GoogleAI模式準備購買商品的消費者提供專屬優惠,該模式由Gemini模型驅動。Google廣告與商務副總裁Vidhya Srinivasan表示,這是一個超越傳統搜尋廣告模式的新概念,使零售商能夠在最關鍵時刻向AI模式購物者提供價值以促成交易。Google的AI將根據使用者的購物行為和購買可能性來決定何時展示優惠。此舉正值AI聊天機器人對Google傳統"贊助"廣告位構成威脅之際,該廣告位每年為Google帶來數百億美元收入。包括OpenAI、微軟和Perplexity在內的AI公司在過去一年中競相在其聊天機器人中推出電商功能,以尋找從其成本高昂的AI產品中產生收入的新方式。 (invest wallstreet)
AI進入「拼爹」的時代
有技術的,幹不過有背景的?如果說AI故事的第一章叫作「技術的革命」,那麼第二章的主題,看起來越來越像「權力的遊戲」。王晶曾說,過去的香港,每個拍電影的都是有“背景”的。因此演員和導演往往身不由己,電影生意的競爭也往往是背景的競爭。AI生意越來越有這個意思。大家都帶著背景和資源,這裡是Google、微軟、Meta、字節、騰訊、阿里交鋒的修羅場。每一天,抖音用自己浩如煙海的流量鋪天蓋地推舉豆包。Google用全公司的資源,在一系列APP裡狂推自己的Gemini。這種巨頭之力,那怕優秀如Manus、OpenAI也難以對抗。2025年11月起,原本落後的Google迅速在性能和使用者上追趕上了ChatGPT,尤其是在多模態領域,已經反超OpenAI在各種評測中位居第一。奧特曼直言,Google的崛起給OpenAI帶來很大的壓力。曾經火遍全球的通用智能體Manus,也放棄了單打獨鬥,網際網路巨頭Meta選擇將收購Manus。Kimi、DeepSeek這些紅極一時的“當紅炸子雞”早已被豆包、元寶鋪天蓋地的流量壓了下去。在這個拼爹的世界裡,似乎只有超級巨頭才有上桌的資格。以小博大的故事在商業裡十分常見。那怕是騰訊、阿里、Google、蘋果,也經常在某個領域輸給創業公司。但在AI裡,這種故事好像顯得困難了許多。看能力,更看資源娛樂圈裡有一種說法,藝人只要給足飽和式的曝光,都能紅。這也是眼下AI領域的現狀。ChatGPT是ChatBot的發明者,相當於蘋果發明了現代智慧型手機,無論是技術,還是品牌,都是真正的遙遙領先。但當超級巨頭Google發力,ChatGPT很快感受到了壓力。Gemini在多項機構評測中反超GPT,奧特曼在內部信中發出警告:公司的技術領先優勢正在縮小,並預計外界氛圍將在一段時間內“相當艱難”。國內市場,豆包早已取代Kimi成為月活第一的LLM產品。以搭載DeepSeek為賣點的元寶使用者資料也早已反超DeepSeek,成為了DeepSeek崛起的流量受益者。它們為什麼如此強勢,逆襲領先者?答案當然是因為有Google、字節跳動這些大廠在背後提供資源。其實明星AI創業公司背後都有大企業和大資本的投資,帳上也有很多錢,也有很多資源。但背靠巨頭帶來的生態優勢,創業公司們真的沒法復刻。比如Google直接把Gemini植入Android,作為默認的手機助手。Google還有排名第一的瀏覽器Chrome,Gmail,微軟的Copilot也直接融入Office套件。這種與常用APP繫結的方式,使用者不用也得用——而且為什麼不用呢?深度整合入常用APP的AI,體驗是非常絲滑的。金山軟體和微軟一樣,直接把AI融進WPS裡。騰訊也直接把元寶塞進微信裡,使用者無需下載任何APP就能在微信聊天框裡體驗到LLM。那怕是AI落腳點相對少的阿里和螞蟻,也有支付寶、夸克這樣的優質入口。這樣的做法OpenAI、Manus、Kimi們要如何模仿?難道為了與大廠競爭,還要自己做一個手機作業系統或者微信?有些生意,是自力更生,創業公司挑戰巨頭雖然困難,但也有機會。比如米哈游靠著幾部爆款遊戲,迅速在二次元遊戲領域裡成為老大,網易和騰訊資源再多,也沒能阻止米哈游的崛起。但有些生意,對外界的依附太重。AI應用恰恰是這種生意。第一,當然是因為它資產太重,網際網路產品最大的成本往往是買流量,但AI背後可能是數千億美元的固定資產,居民樓創業玩不轉。第二,更重要的是,它的使用場景,與生態的繫結太深,太需要與其他產品的聯動。Manus就是個很好的例子:它的功能當然強大,但在個人使用者端完全沒法獨立幹活,它需要“呼叫”其他網頁,依賴瀏覽器和瀏覽器中的資料。比如訂一張機票,需要帳號授權、支付授權——這些東西都掌握在Google、蘋果、微信這種巨頭手裡。Manus干的是系統級的活,卻完全沒有系統級的權限。相當於普通孩子學了一門“千萬資產理財課”,但他家卻沒有千萬資產。當Google這種瀏覽器和手機作業系統的擁有者親自下場,留給獨立智能體的空間就會越來越狹小。AI搜尋也感受到了這種壓力。畢竟在這個時代,搜尋早不是什麼獨立的APP了,iPhone裡的搜尋框,是由蘋果公司控制的。Perplexity再好用,它也不是蘋果的默認搜尋引擎——Google一年付200億美元獲得了這個身份。在國內,搜尋框則由百度、微信、手機廠商把持,他們很難把搜尋框交給AI創業公司。即便他們利用技術優勢,暫時在大廠的競爭壓力中獲得一定份額,他們還要面臨第二個難題:變現。AI的變現,也得拼爹富貴人家,總是更容易收回教育孩子的成本。他們送孩子去讀個水碩,可以憑藉家庭關係安排進國際銀行,或者進入家族企業擔當要職。但窮人家送孩子去國外讀一年碩士,畢業卻可能會因為學歷含金量不高找不到工作。視角切到AI的變現身上,也沒什麼不同,同樣的一個技術,小公司持有難以變現,大公司就能以不同的方式收到錢。比如在OpenAI還在陷入虧損難題的時候,微軟就通過把GPT服務打包進自家雲服務實現了業績的大幅度增長。OpenAI Service已經成了微軟Azure的王牌產品之一,畢竟客戶們本來就購買了微軟的雲服務,再買點AI服務,屬於捆綁銷售。更不用說Copilot和Office(Microsoft 365)的聯動,微軟把AI工具加入到辦公套件裡,上調訂閱費——不接受?那就別用Office。這也是微軟過去十年重要的增長來源。每當新技術、新變革、新功能出現時,他們就可以對訂閱服務漲價。當然這種漲價是雙贏的,客戶也收穫了便利和價值。在C端,從Gemini和OpenAI的會員中,也可以看到捆綁銷售能力的差距:同樣是賣20美元,Google就可以打包把GoogleOne(Android版本的iCloud)一併打包售賣,AI之外,使用者還能獲得Gmail、相簿裡的儲存空間。這是非常具備吸引力的捆綁銷售方案,畢竟那怕不用AI,使用者也需要郵件和存照片。不難想像,如果Manus屬於Google這樣的巨頭,也許它也會把Manus的訂閱服務加進這個20美元套餐裡,Manus的變現就會更加順滑。而OpenAI的訂閱幾乎只有ChatGPT,那怕Sora、Codex等新產品,也是靠OpenAI自己做的。豆包的變現花樣更加豐富。豆包的回答會把流量引入短影片——之後的商業模式就可以和抖音一樣了,在視訊中間插入廣告就好。豆包還上線了直接的Chat廣告,對話方塊的回答可以直達抖音生態內部的本地生活等服務。比如在豆包裡問附近的好餐館,豆包會直接給出團購連結。圖註:點選連結,就能直達餐館的抖音團購介面這種商業模式Kimi們很難學習,畢竟創業公司可沒有抖音那麼多短影片儲備,也沒有發達的本地生活服務或者電商的供應鏈。它只能向外去賣流量,但眼下的AI行業格局來看,大多數交易平台並不願意把入口交給其他AI工具,即便願意,變現的轉化率也不如生態內那樣高。如果沒有這些變現花樣,那麼AI的商業模式和老乾媽辣醬差不多——一手交錢,一手交貨。也就是在B端賣Token,C端賣訂閱。但這個模式太捲了:客戶只在乎多少錢買到多少Token,難以像微軟的雲服務一樣溢價。個人使用者的訂閱費價格被使用者習慣和行業共識限制:要麼20美元,要麼10-30人民幣。這是多個行業與使用者長期博弈出來的價格,是使用者訂閱習慣的平衡點,大多數行業的訂閱會員,最後都會回歸到這個數字附近。圖註:MiniMax國內產品“星野”的訂閱費用。事實上,國內大多數會員的網路訂閱會員的價格都在這個數字附近,誰想賣更貴都很困難。最近遞交招股書的智普AI和MiniMax,虧損資料都十分嚴重——創業公司,虧損當然很正常,但它們的虧損呈現逐年擴大趨勢,暫時看不到盈利預期在那裡。事實上,這二者的虧損被廣泛討論並不是因為它們的虧損尤為突出,只是因為它們遞交了招股書,在那些沒有遞交招股書的AI企業中,還藏著更為廣泛、普遍的虧損。那怕是已經有7億使用者的OpenAI也不例外。而這個問題,創業公司自己解決起來異常困難,最終很可能需要仰仗大廠的力量。小蝌蚪找爸爸在這個“拼爹”的世界裡,單打獨鬥似乎很難出頭。當出價合理,賣身給巨頭,也是不錯的選擇。Meta接連宣佈收購Scale和Manus,蘋果也被爆出考慮收購Perlexity。一旦被收購,情況就完全不同了。以Manus為例,它過去想呼叫一些功能,要看其他公司給不給權限,還要面臨巨頭自研智能體的競爭風險。但一旦屬於Meta,Manus就可以直接在WhatsAPP、INS、Messenger、Facebook裡獲得原生等級的權限,隨意呼叫各種聊天、購物的功能。更不用說Meta還有AI硬體的佈局,如果與AR眼鏡結合,Manus就能直接獲取SIRI等級的權限。這類AI應用公司,被大廠收購的好處實在是顯而易見。當然,如果自己能成為大廠,誰願意依附大廠呢?OpenAI就不願意。OpenAI原本是有巨頭靠山的,微軟是它的最大的單一機構股東。但可惜,由於特殊的架構,微軟並沒有獲得OpenAI的控制權。微軟管不了OpenAI,自然就不拿它當“親兒子”,不但自己有自己的AI產品,還訓練自己的模型。OpenAI也不想給誰做子公司,作為LLM的最大開創者,它只想自己成為超級大廠。明明微軟有現成的Edge瀏覽器,但OpenAI還是自己想做瀏覽器Atlas,明明微軟是最大的雲服務商,自己找合作夥伴建立算力能力,還與Google合作購買GCP服務。顯然,OpenAI希望成為美股七姐妹那樣真正的超級巨頭。這條路在網際網路時代是被驗證過的,每當行業出現大的變革,總會出現創業公司的崛起,用靈活性打得巨頭節節敗退,甚至最終自己成為巨頭。比如字節跳動在BAT三家統治的網際網路裡,硬是從居民樓裡殺出一條血路,成為網際網路的新一極。還有拼多多、米哈游這種在與騰訊和阿里的競爭中勝利,成為細分領域頭部的公司。畢竟行業的紅利時期總是充滿變革,方向、創意、技術、靈活性才是最重要的。但這條路在AI領域顯得難了太多,三年過去,創業公司的靈活性優勢和先發優勢不斷被大廠的體量碾壓,超級巨頭的優勢愈發明顯。巨頭對各種系統級的入口掌握權限,起到的作用太大了。如果說AI故事的第一章叫作「技術的革命」,那麼第二章的主題,看起來越來越像「權力的遊戲」。 (鈦媒體)
Gemini AI 預測:XRP、ETH和BNB在2026年初的價格
加密貨幣一直難以站穩在3兆美元上方,因為10月10日的閃崩打亂了山寨季開局。以太幣(ETH)和瑞波幣(XRP)等主要山寨幣在年初至今(YTD)的統計口徑下已轉為負收益,而幣安幣(BNB)在此期間仍實現了21%的漲幅。這3幣在2026年初可能會走向何方?谷歌強大的AI模型Gemini與我們分享了它對這些山寨幣的預測。1 – Gemini對瑞波幣(XRP)的預測瑞波幣(XRP)在今年於2024年末強勁拉升後進入盤整。它在與美國證券交易委員會(SEC)長期訴訟中的法律勝利,以及強勁的生態系統成長舉措,影響了其在2025年的價格表現。據Gemini稱,為了防止大幅下跌至1.20美元,需要關注的關鍵支撐位是1.75美元區域。同時,其最重要的阻力位在2.36美元。這也是該代幣200日指數移動平均線(EMA)所在的位置。若價格突破該水平,將確認XRP的看漲前景。Gemini對2026年第1季作出以下預測:“急劇下跌似乎已經停止,這表明2026年初可能進入築底過程。”2 – Gemini對以太幣(ETH)的預測以太坊今年的表現主要受到4月成功實施Pectra升級的影響。這次技術層面的全面改造在幾個月後將價格推動至新的歷史最高點。Gemini指出,當時需要關注的關鍵支撐位是2,800美元區域。若跌破該水平,短期內可能下探至2,400美元。同時,3,370美元區域似乎是價格必須突破的關鍵阻力位,只有越過該水平,才有望反彈回到4,000美元區間。其對2026年初以太坊的基準預測是盤整。 Gemini根據最新價格走勢的分析作出以下結論:“ETH很可能在2026年初橫盤交易,以構築底部。”3 – Gemini對BNB幣(BNB)的預測BNB幣(BNB)是今年前5大幣種中表現最好的代幣。 Aster和Pancake Swap等去中心化協議的熱度上升,推動了該網路交易量的成長。該代幣近期創下1,360美元的新歷史高點。 Gemini認為,如果價格在2026年最初幾週回調,800美元將是需要關注的關鍵支撐位。同時,BNB需要突破1,000美元這個心理關口,才有望反彈至10月所見的高點水準。Gemini將即將到來的2026年第1季視為市場的「決策點」。此AI模型就BNB的前景作出如下結論:“2026年初很可能會出現一次決定性的走勢,脫離850美元這一樞軸位。鑑於RSI(47)走勢平緩,如果整體加密市場趨於穩定,反彈的概率略高於崩盤。”Gemini認為市場已經見底在評估了這3種主要山寨幣的價格走勢之後,Gemini對加密市場整體狀態分享瞭如下有趣觀點:“圖表顯示,加密市場正處於修正末期或早期吸籌階段。2025年年中那種爆發式增長已經減弱,而2026年初很可能將以資本保全和區間震盪交易為主要特徵。”隨著整體市場進入盤整,在某些類別(如迷因幣)中把握最具吸引力的機會,可能會帶來顯著差異。 Maxi Doge($MAXI)等熱門加密預售項目,可能是新年伊始能夠帶來可觀收益的潛在隱藏寶石。Maxi Doge($MAXI)融資超400萬美元,將迷因熱度帶入交易領域Maxi Doge($MAXI)是以太坊迷因幣,靈感來自廣受歡迎的Doge迷因。其目標是打造一個蓬勃發展的社區,聚集志同道合的風險偏好者,他們知道自己唯一能走出媽媽地下室的辦法,就是靠少數幾筆YOLO交易狠狠乾一票。該專案透過Maxi Ripped和Maxi Gains等有趣競賽促進社群參與,交易者可以透過分享收益最高的交易來獲得誘人的獎勵與炫耀資本。同時,$MAXI持有者可獨家訪問一個集體“蜂群思維”,他們能夠通過為此專門創建的入口,與其他“degen”分享想法、洞見與交易佈局。購買$MAXI並加入拉升行情,只需前往Maxi Doge官方官網並連接你常用的以太坊錢包(例如Best Wallet)。你可以用USDT或ETH兌換該代幣,也可以使用銀行卡購買。點擊訪問Maxi Doge官方官網按此瀏覽原文免責聲明加密貨幣投資風險高,價格波動大,可能導致資金損失。本文僅供參考,不構成投資建議。請自行研究(DYOR)並謹慎決策。
奧爾特曼點名“AI記憶”,儲存環節迎來新敘事
奧爾特曼表示,“雖然說這是2026年(要考慮)的事,但它是我個人最期待的部分之一。”“這是整個系統裡我個人最期待的部分之一。”在日前的Big Technology訪談中,OpenAI CEO山姆•奧爾特曼(Sam Altman)如此形容記憶功能。在他看來,AI的下一個重大飛躍並非是更敏銳的推理能力,而是更為根本的記憶。ChatGPT問世三年多以來,聊天介面並沒有出現大變動,但底層功能進步不少,其中就包括記憶功能。在訪談中,當被問及“記憶功能究竟發展到什麼程度”時,奧爾特曼表示,“其實我認為我們現在完全無法想像它最終能發展到什麼程度。人類本身是有侷限的:即使你擁有世界上最好的私人助理,他們也不可能記住你說過的每一句話,不可能讀過你的每一封郵件,不可能看過你寫的每一份檔案,不可能每天觀察你的所有工作並記住每一個細節,也不可能以那樣的深度參與到你的生活中——沒有任何人類擁有完美無限的記憶,但AI肯定可以做到這些。”記憶功能是OpenAI內部經常討論的一個問題。目前ChatGPT雖然迭代到了5.2,但記憶功能“依然非常粗糙、非常早期”,仍處於“GPT-2時代”。一旦AI真的能記住你整個人生的每一個細節,並在此基礎上加以個性化——不僅能記住事實,還能察覺、捕捉並利用那些連使用者自己都沒意識到未曾刻意表達過的小偏好,AI將變得極其強大。“我覺得這是一個非常令人興奮的方向。雖然說這是2026年(要考慮)的事,但它是整個系統中我個人最期待的部分之一。”奧爾特曼直言。▌KV Cache重要性凸顯此前,OpenAI已於2024年2月啟動記憶功能小範圍測試,並於2025年4月升級為可參考全部歷史對話的長期記憶系統,能跨對話保留使用者偏好、工作內容與常用格式,在互動中持續呼叫,顯著強化個性化服務與使用者黏性。可以看到,在奧爾特曼的描述遠景中,擁有了成熟記憶能力的ChatGPT堪稱“開了掛的超級個人AI Agent”。根據《Heterogeneous Memory Opportunity with Agentic AI and Memory Centric Computing》(Jinin So),建構一個強大的“Agentic AI”,因為自注意力機制需要對序列中的每個元素(token)與序列中所有其他元素之間的關係進行建模,因此對記憶體和儲存系統提出了前所未有的、多層次的需求和挑戰。AI記憶系統可以被劃分為工作記憶(處理當前任務)和長期記憶(知識、技能、經驗)。程序性記憶(模型本身):隨著大語言模型參數量的增長,其自身大小已達到TB等級;語義記憶(外部知識庫):儲存外部知識的向量資料庫,其容量需求可達數十TB;工作記憶(執行階段快取):在高並行推理時,僅KV快取(KV Cache)一項就能消耗上百TB的記憶體。整個系統融合了大模型(如Gemini)、外部資料庫(如Milvus)和快取記憶體機制,並通過檢索、學習等方式進行互動,這對資料流動的頻寬和延遲提出了極高要求。其中,“能記住使用者說過的所有話、讀完所有郵件和文件、深度全量參與使用者生活”的AI,需要的正是“工作記憶”。廣發證券指出,AI的“工作記憶”在技術上體現為大模型的“上下文窗口”,它是AI進行複雜、多步推理和決策的工作台與基礎。它的核心功能是整合所有相關資訊以支援連貫思考。通過將系統指令、歷史對話、使用者問題、外部知識(來自語義記憶)和模型的中間思路全部“盡收眼底”,大模型才能進行全面、有深度的推理,而不是孤立地看問題。國金證券稱,目前隨著大模型應用的普及和上下文窗口的不斷擴展,KV Cache技術的重要性將進一步凸顯。無論是ChatGPT的流暢對話體驗,還是Claude的長文件處理能力,都需要KV Cache的技術支撐。未來KV Cache將在智能化、硬體加速、邊緣部署等方向持續演進,為更廣泛的AI應用提供強有力的技術支撐。智能化與硬體化趨勢明確,KV Cache有望在未來數年持續提升大模型推理效率並改善算力成本結構。落實到具體方向上,東方證券認為,儲存供不應求持續,同時海外儲存巨頭在通用儲存方面的擴產進度可能有限,建議關注國內半導體裝置企業中微公司、京儀裝備、微導奈米、拓荊科技、北方華創等;佈局端側AI儲存方案的兆易創新、北京君正等;受益儲存技術迭代的瀾起科技、聯芸科技等;國產企業級SSD及儲存方案廠商江波龍、德明利、佰維儲存等。 (科創板日報)
🎯你被洗出場了嗎?美光大漲,台股將複製11/21劇本?!Line@連結:https://lin.ee/mua8YUP🎯這先股票誰先噴?2330台積電、2408南亞科、2317鴻海、5309系統電、3037欣興、4991環宇-KY📌台股連跌四天後,今日出現強力反彈相信大家都不會意外才對!因為這次又跟11月一樣這個畫面,跟11/21幾乎一模一樣。指數再一次精準回測仍上彎的生命線(季線後止跌),當時一堆人嚇到不敢看盤,結果呢?守住後直接展開新一波攻勢。📌再來看市場最怕的四個字:AI泡沫?美光最新財測已直接打臉市場:下季營收187億美元,市場只估142億;EPS 8.42美元,幾乎是預期的兩倍。美光執行長講得很白:「AI資料中心需求正在加速轉強。」這代表什麼?AI不但沒退燒,2026年才是真正主秀登場,從晶片競賽,走向大型資料中心大建設+AI應用全面落地。現在連蘋果都坐不住了。市場傳出2026年新版Siri將導入Google Gemini,當iPhone正式進化成AI Phone,又是一波換機潮!👇重點來了台股目前多頭可用之兵超多除了記憶體外,六大軍火庫已滿倉備戰:被動元件供不應求、2奈米設備滿單、CPO(矽光子)、高階ABF載板、低軌衛星全面啟動。最後結論:AI不是口號,是一條會把整條供應鏈一起拉上來的需求主線。這波拉回,再次證明:機會是留給有準備的人這次拉回又是彎腰撿鑽石的機會。🔴接下來我們會在粉絲團持續幫大家鎖定+追蹤,若還不知道該如何操作?那建議你務必要鎖定江江在Line @,將有更進一步的訊息給大家了解。https://lin.ee/mua8YUP🔴想了解還未起漲的市場主流,同步了解大盤多空轉折點及學習預測技術分析,江江YT節目都會持續追蹤+預告。https://reurl.cc/02drMk********************************************************有持股問題或想要飆股→請加入Line:https://lin.ee/mua8YUP江江的Youtube【點股成金】解盤:https://reurl.cc/02drMk*********************************************************(本公司所推薦分析之個別有價證券 無不當之財務利益關係以往之績效不保證未來獲利 投資人應獨立判斷 審慎評估並自負投資風險)
Google豪賭背後,一場靜默的中國供應鏈革命
12月9日,Google正式發佈Android XR平台,並展示了與中國企業XREAL聯合打造的Project Aura——一款被定義為“Gemini AI第一雙原生空間之眼”的消費級AR眼鏡。在AI與XR深度融合的新戰場上,矽谷巨頭正在以一種前所未有的姿態,將核心硬體能力的話語權交到中國企業手中。這個訊號的深意,遠比表面呈現的更加複雜。當我們將視線穿透產品本身,審視這場發佈會背後的產業邏輯時,會發現在這個被視為下一代計算平台的賽道上,中國的光學系統、晶片設計和製造供應鏈,正在從代工者悄然轉變為定義者。某種意義上,一場靜默的“反向卡脖子”正在發生。Google的“第二次入場”:一場遲到但志在必得的豪賭理解Google此番佈局的深意,需要先回溯其在可穿戴裝置領域的曲折歷程。2013年,Google眼鏡以顛覆者的姿態驚豔亮相,卻因隱私爭議、高昂定價和孱弱的應用生態黯然離場。十餘年過去,當Meta憑藉Ray-Ban智能眼鏡悄然佔據市場,當蘋果以Vision Pro重新定義空間計算的產品形態,當字節跳動、華為等中國玩家在XR賽道密集佈局時,Google發現自己正處於一個危險的位置:它擁有全球最先進的AI能力,卻缺乏一個能讓這種能力“走出螢幕”的硬體載體。Meta的Ray-Ban智能眼鏡這正是Android XR平台的戰略核心所在。Google試圖複製其在智慧型手機時代的成功路徑——通過開放平台吸引硬體合作夥伴,建立生態標準,最終實現系統級的統治地位。但這一次,它面臨的挑戰遠比當年更加嚴峻。智能眼鏡不是智慧型手機的簡單延伸,它需要在光學顯示、空間計算、續航散熱和佩戴舒適性之間尋找極其精細的平衡點。而這些平衡點的技術實現,恰恰是Google自身並不擅長的領域。於是,一個有趣的現象出現了:在Android XR平台的首發產品矩陣中,最具技術含量的Project Aura,其核心硬體研發幾乎全部由中國團隊完成。X-Prism光學系統由XREAL中國團隊獨立研發量產,X1S空間計算晶片由XREAL端到端自研,完整供應鏈紮根長三角。Google提供了AI大腦和軟體平台,但讓這個大腦“看見世界”的眼睛,卻是中國製造。當前的XR市場正處於一個微妙的臨界點。從產品形態上看,存在三條平行演進的路徑:以蘋果Vision Pro為代表的高端沉浸式頭顯,以Meta Ray-Ban為代表的輕量化智能眼鏡,以及介於兩者之間的AR顯示眼鏡。這三條路徑分別對應著不同的使用場景、技術難度和市場定位,尚未出現誰將最終勝出的明確訊號。從市場份額來看,Meta憑藉先發優勢和激進的定價策略佔據了消費級智能眼鏡的主導地位。Ray-Ban Stories系列累計銷量已突破數百萬台,建立起了初步的使用者認知和使用習慣。蘋果Vision Pro雖然在技術上實現了諸多突破,但3499美元的高昂定價嚴重限制了其市場滲透,更多地扮演著技術燈塔的角色。至於Google,在Android XR發佈之前,其在XR硬體領域幾乎是一片空白。但市場份額並不能完全反映競爭的真實態勢。XR產業仍處於極早期階段,現有的銷量數字在未來可能出現數量級的變化。真正決定長期競爭格局的,是三個關鍵要素:AI能力的深度整合程度、硬體形態的成熟度,以及生態系統的開放性。從這三個維度審視,Google此番入局的時機選擇頗具深意。首先,Gemini AI的能力已經發展到足以支撐空間計算場景的臨界點。多模態理解、即時視覺推理、上下文感知對話——這些能力的組合,使得AI真正具備了理解世界的基礎能力。其次,硬體技術的成熟度也在快速提升。Micro OLED顯示、先進光學設計、低功耗空間計算晶片,這些技術的進步使得消費級AR眼鏡成為可能。最後,Android的開放生態基因使其天然適合扮演平台角色,這是蘋果封閉生態所不具備的優勢。技術突破的關鍵節點:當AI開始“看見”世界Project Aura之所以被稱為“Gemini AI的第一雙原生空間之眼”,源於其實現了AI與XR的深度原生融合。這種融合並非簡單地將AI助手嵌入眼鏡裝置,而是讓AI真正具備了空間理解和環境互動的能力。要理解這一突破的意義,需要先釐清AI能力演進的脈絡。大語言模型讓AI“能聽會說”,多模態模型讓AI“能看會畫”,但這些能力仍然被困在二維螢幕的邊界內。AI可以分析一張照片,但無法持續感知真實環境的變化;可以理解一段對話,但無法將對話內容與物理空間關聯。Project Aura試圖打破這一邊界。通過三個攝影機、麥克風和環境感測器的組合,Gemini首次能夠在真實世界中建構“連續、可互動、可理解”的空間語義模型。這種能力的實現依賴於幾項關鍵技術的協同突破。光學系統方面,70度視場角(FOV)是消費級AR眼鏡目前能實現的最大實用視場,它決定了數字內容能夠多大程度地自然疊加在真實環境中。XREAL的X-Prism棱鏡透鏡技術在這一指標上達到了行業領先水平,同時將整體重量控制在可日常佩戴的範圍內。空間計算方面,X1S晶片建構了低延遲、高精度的空間智能鏈路,能夠同時處理三個攝影機的資料輸入,實現全房間追蹤和手勢識別。AI推理方面,Gemini的端側部署使得即時語義理解成為可能,使用者可以用手指在空中圈選任何物體,立即獲得相關資訊和搜尋結果。CNET記者Scott Stein在體驗後寫道:“坐在沙發上戴著Project Aura,這副原型眼鏡立即讓我感覺像是VR被縮小到了更小的形態。”他啟動了一個無線連接的電腦視窗,用手勢控制應用,甚至運行了VR遊戲Demeo。“最令我驚訝的是,所有這些都可以僅憑一副眼鏡實現。”這種評價的份量在於,它來自一個見證了過去十年幾乎所有XR產品的資深觀察者。然而,技術突破並不意味著產業成熟。心智觀察所之前曾撰文指出,智能眼鏡領域存在一個被業內稱為“不可能三角”的結構性難題:全天候舒適佩戴、極佳的顯示效果、強大的AI智能化——當前沒有任何一款裝置能夠同時完美解決這三點。舒適佩戴要求裝置重量極輕、發熱量低、外觀時尚,這意味著電池容量、晶片算力和顯示單元尺寸都必須大幅壓縮。極佳的顯示效果要求高解析度、大視場角、高亮度和良好的透光率,這需要更複雜的光學系統和更大的顯示單元。強大的AI智能化要求高算力的晶片、豐富的感測器和持續的網路連線,這進一步增加了功耗和發熱。這三個維度彼此制約,形成了一個難以突破的技術瓶頸。XREAL創始人兼CEO徐馳坦承,Project Aura並不試圖解決全天佩戴的問題,其定位是可攜式工作裝置而非日常穿戴配件。但他同時預測,未來智能眼鏡可能會演化出二元化的產品形態:一種主打35克以下的全天候佩戴,以犧牲顯示效果和算力為代價;另一種則以更好的顯示效果為基準,重量約50至60克,適合特定場景的沉浸式使用。除了硬體層面的不可能三角,智能眼鏡還面臨著軟體生態和使用者接受度的雙重挑戰。應用開發者需要為全新的互動範式重新設計產品,而使用者則需要克服將裝置佩戴在面部的心理障礙和社會壓力。Google眼鏡當年的失敗,很大程度上源於這兩個層面的不成熟。即便技術已經取得長足進步,這些非技術因素仍然是產業化道路上的重要變數。靜默的權力轉移:中國供應鏈如何重塑行業格局在討論智能眼鏡產業的未來時,一個經常被忽視的維度是供應鏈的權力結構。過去十年,中國製造在全球科技產業鏈中的角色,主要是成本優勢驅動的代工和組裝。但在XR這個新興賽道上,情況正在發生根本性的變化。Project Aura的案例極具說明性。這款被Google定位為Android XR平台最完整、最接近理想形態的硬體樣本的產品,其核心技術幾乎全部來自中國。X-Prism光學系統是消費級AR眼鏡最關鍵的技術壁壘之一,它決定了裝置的視場角、清晰度、色彩還原和佩戴舒適度,而這一系統由XREAL中國團隊從零開始獨立研發並實現量產。X1S空間計算晶片是另一個技術高地,它需要在極低功耗下實現多攝影機資料的即時處理和空間定位,而這顆晶片由XREAL端到端自主設計。更值得關注的是,支撐這些核心技術的完整供應鏈已經在長三角地區成型。從光學鏡片的精密加工,到Micro OLED螢幕的生產,再到晶片的封裝測試和整機組裝,一條高度整合、快速迭代的產業鏈正在形成閉環。上海作為XREAL的全球研發中心,正在成為智能眼鏡產業創新的核心樞紐。這種供應鏈格局的形成並非偶然。智能眼鏡對製造精度的要求遠超智慧型手機,光學系統的微米級公差控制、顯示模組的精密貼合、整機的輕量化設計,每一個環節都需要長期積累的工藝經驗和快速迭代的能力。中國製造業在消費電子領域二十餘年的積澱,恰恰為這一新賽道提供了堅實的基礎。如果說過去幾年中美科技競爭的主旋律是美國對中國的“卡脖子”——從晶片製造裝置到EDA軟體,從先進製程到AI晶片——那麼在XR領域,一種反向的依賴關係正在悄然形成。讓我們做一個假設:如果XREAL或其他中國XR供應商決定不再向海外整機廠商提供核心光學模組和空間計算晶片,會發生什麼?Google的Android XR平台將失去其最具競爭力的硬體載體;Meta的下一代AR眼鏡可能面臨關鍵零部件的供應中斷;甚至蘋果,儘管其自研能力強大,也不得不依賴中國供應鏈來實現規模量產。這並非危言聳聽。在AR光學這個細分領域,中國企業已經建立起了難以綁過的技術和產能優勢。Birdbath方案、自由曲面棱鏡、光波導——無論那種技術路線,中國供應商都處於全球領先位置。而在Micro OLED和Micro LED顯示領域,中國企業同樣佔據著重要份額。更重要的是,這些技術優勢是與製造能力深度繫結的——即便競爭對手獲得了設計圖紙,要在短期內建立起具有競爭力的生產線幾乎不可能。徐馳在極客公園創新大會上的一番話頗耐尋味:“沒有任何一家公司能包攬系統、AI與硬體的所有創新。下一代計算平台需要一個全球化創新聯盟。而中國憑藉最完整的製造鏈條與最快的硬體創新速度,第一次真正站在了定義未來標準的位置。”這番表態的潛台詞是:中國不再只是執行別人定義的標準,而是有能力參與甚至主導標準的制定。當然,“反向卡脖子”的能力並不意味著一定會被使用。全球科技產業的相互依存是雙向的,任何一方的脫鉤都會帶來巨大的成本。但能力本身就是一種談判籌碼,它改變了博弈的基本結構。在過去,中國企業在與海外巨頭的合作中往往處於被動地位,核心技術和利潤分配由對方主導。而在XR這個新賽道上,中國企業有機會以更平等的姿態參與全球競爭,甚至在某些環節掌握主動權。增量資料的入口:眼鏡通向AGI的必經之路?徐馳提出了一個引人深思的觀點:“眼鏡所帶來的增量資料,很可能是AI通向AGI的必經之路。”這一論斷的邏輯在於,當前AI訓練所依賴的公域和私域資料都已接近枯竭,而智能眼鏡將成為為AI提供更多個性化增量資料的最佳入口。這個觀點觸及了AI發展的一個核心瓶頸:資料。大語言模型的能力提升在很大程度上依賴於訓練資料的規模和質量,而網際網路上可用的高品質文字資料正在被快速消耗。視覺資料、空間資料、行為資料——這些智能眼鏡能夠持續採集的多模態資訊,可能是下一階段AI能力躍升的關鍵燃料。如果這一判斷成立,那麼智能眼鏡的戰略意義將遠超其作為消費電子產品的範疇。它將成為AI能力演進的基礎設施,而掌握這一基礎設施的企業和國家,將在AI時代佔據戰略高地。從這個角度看,中國企業在智能眼鏡核心技術上的突破,其意義不僅在於一個新產品品類的競爭力,更在於對AI發展基礎資源的控制力。徐馳預測,一個真正具備“iPhone時刻”意義的智能眼鏡產品將在未來兩到三年內問世。如果真是2027年,那恰好是20年的輪迴:從2007年初代iPhone到2027年。這個時間預測是否精準尚待驗證,但其背後的判斷邏輯值得重視:技術成熟度、生態準備度和使用者接受度正在同時逼近臨界點。Google此番發佈Android XR平台和Project Aura,正是這一臨界點的訊號之一。它表明,即便是擁有全球最強AI能力的科技巨頭,也必須借助中國的硬體創新能力才能將願景轉化為產品。它也表明,下一代計算平台的競爭將不再是單一公司或單一國家的獨角戲,而是一場全球化的協作與博弈。在這場博弈中,中國的位置正在發生微妙而深刻的變化。從全球工廠到創新源頭,從標準執行者到標準定義者,從被動依附到可以反制——這些變化或許還不夠顯性,但其勢能正在積聚。當AI開始“長出眼睛”,中國製造的技術基因,已經深深嵌入了這雙眼睛的每一個零部件之中。未來已來,只是分佈不均。而在智能眼鏡這個承載下一代計算平台願景的賽道上,中國或許正站在分佈最密集的那個節點上。 (心智觀察所)
AI 算力:Google vs 輝達
近日,SemiAnalysis發佈文章《TPUv7: Google或終結輝達的CUDA護城河》指出,世界上最好的兩大模型Anthropic的Claude 4.5 Opus和Google的Gemini 3主要的訓練和推理基礎設施用的都是Google的TPUs和亞馬遜的Trainium,尤其Gemini 3完全是基於TPUs訓練的。事實上,Anthropic等AI實驗室現在可以通過採購(或者威脅採購)TPU,來作為與輝達談判的籌碼,從而大幅降低其GPU的總體擁有成本。黃仁勳從多年前反覆強調的、語氣詼諧但似乎又是不爭的事實的“The more you buy, the more you save”,本來是說The more GPUs you buy, the more money you save,現在似乎就要變成“The more TPUs you buy, the more GPUs you save”。Google2006年開始打造AI專用的基礎設施,到2013年忽然發現,如果要大規模部署AI,就需要讓資料中心的數量翻倍,於是伴隨著越發緊迫的算力需求,TPU晶片在2016年投產,一開始只用於Google內部的工作流,2018年面向GCP客戶提供服務,然後商業化路線越發清晰,現在不僅通過GCP讓TPU全端能力惠及外部客戶,而且作為供應商直接出售完整的TPU系統。今年10月,Anthropic宣佈進一步使用Google雲的技術,包括在2026年投入數百億美元,以多至100萬塊TPUs上線超過1吉瓦的算力,用以支援AI研究和產品研發。而在Anthropic之外,Meta、SSI、xAI等也已加入GoogleTPU的客戶名單。輝達前幾天甚至發文試圖穩住市場對自己的信心,雖然所謂“祝賀Google的成功(We’re delighted by Google’s success)”沒有明確指向是AI應用的成功還是基礎設施的成功——Perhaps both.想到上個月巴菲特的Berkshire Hathaway建倉Google母公司Alphabet,持倉43億美元,而這是股神首次買入“AI題材股”。想到薛兆豐老師的《漫畫經濟學》說:所謂的“內幕消息”都會提前反映在資產價格中。不過,這裡的“內幕消息”絕不只是浮於表面的“某條消息”。SemiAnalysis在兩三年前就預言“TPU霸權(TPU supremacy)”,過去一年的持續追蹤也證明了,GoogleTPU的強勢崛起已經成為一個顛覆性的市場力量。儘管單顆TPU晶片的理論峰值算力可能與輝達旗艦產品還有差距,但Google以卓越的系統級工程能力(system-level engineering)可以實現匹敵輝達的性能和成本效率——相較Gemini 3模型的成功,OpenAI自2024年5月發佈GPT-4o以來,還沒有成功完成一個可大規模部署的前沿模型的全規模預訓練任務;而在具有經濟價值的長程任務測試中,Gemini 3相較GPT 5.1更是毫無懸念地勝出。當然,縱使系統能力很重要,Google也沒有忽視微架構(microarchitecture)。之前Google的TPU設計理念相較輝達更為保守,主要是因為Google優先考慮RAS(可靠性、可用性、可服務性),願意犧牲極限性能來換取更高的可用性,因為硬體故障導致的停止成本會嚴重影響實際的TCO。畢竟,不同於輝達和AMD,Google沒有誇大外部宣傳指標的壓力,不用執著於實際上難以維持的“理論FLOPs峰值”,而且在2023年之前Google的主要AI負載是推薦系統模型,對超高算力的需求沒那麼迫切。但是,進入LLM時代,Google的TPU設計理念也在發生轉變。尤其最新兩代TPU(TPUv6 Trillium和TPUv7 Ironwood)——v6在相同製程和晶片面積下實現了2倍的峰值算力提升,且功耗顯著降低;v7則幾乎全面縮小了與輝達旗艦產品的差距,在算力、記憶體頻寬上接近GB200。事實上,從Google自身的採購視角來看,TPUv7的總體擁有成本比直接採購輝達GB200伺服器要低大約44%,完全彌補了峰值算力和峰值記憶體頻寬方面大約10%的不足。即使是對於外部客戶而言,SemiAnalysis預估每小時的TCO仍然可以比GB200低約30%,比GB300低約41%。另外,TPU的一大特徵在於可以通過ICI互聯協議(Inter-Chip Interconnect)實現極大的規模化擴展,單個TPU pod可以支援高達9216顆Ironwood TPUs,這就可以避免多叢集通訊帶來的效率損耗。然而,GoogleTPU的部署速度受制於電力資源和緩慢的行政流程。對此,Google採用“表外信用擔保”模式,通過為Fluidstack等靈活的新興雲提供商(Neoclouds)提供背書,間接利用轉型礦商等新興資料中心提供商所擁有的電力和基礎設施。這個模式很大程度上解決了Neocloud行業的融資難題,i.e. 算力叢集4-5年的經濟壽命與資料中心15年以上租約的期限錯配,SemiAnalysis預測這種“超大規模雲服務商擔保”的模式或成為行業新標準。而CoreWeave、Nebius、Crusoe等與輝達深度繫結的Neoclouds未來可能需要在“爭奪Nvidia Rubin系統配額”與“開拓TPU市場”之間做出關鍵的戰略抉擇。AI算力市場格局正在發生深刻的變革。GoogleTPU的成功意味著AI算力市場不再是輝達“一家獨大”,而競爭或迫使所有廠商不斷推進技術創新和成本最佳化,或許可以推動整個AI產業以更低的門檻、更高的效率向前發展。 (訪穀神)